home *** CD-ROM | disk | FTP | other *** search
/ BCI NET 2 / BCI NET 2.iso / archives / demos / misc / prosite.lha / Prosite / data / PDOC00537 < prev    next >
Encoding:
Text File  |  1995-03-04  |  7.5 KB  |  152 lines

  1. **********************************
  2. * C-type lectin domain signature *
  3. **********************************
  4.  
  5. A number of different families of  proteins share a conserved domain which was
  6. first characterized in  some  animal lectins  and  which seem to function as a
  7. calcium-dependent carbohydrate-recognition domain [1,2,3]. This  domain, which
  8. is known as the C-type lectin domain (CTL)  or as the carbohydrate-recognition
  9. domain (CRD),  consists of about 110 to 130 residues. There are four cysteines
  10. which are perfectly conserved and involved in two disulfide bonds. A schematic
  11. representation of the CTL domain is shown below.
  12.  
  13.                                                          +------+
  14.                                                          |      |
  15.      xcxxxxcxxxxxxxCxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxCxxxxWxCxxxxCx
  16.       |    |       |                                     ************|*
  17.       +----+       +-------------------------------------------------+
  18.  
  19. 'C': conserved cysteine involved in a disulfide bond.
  20. 'c': optional cysteine involved in a disulfide bond.
  21. '*': position of the pattern.
  22.  
  23. The categories of proteins, in which the CTL domain has been found, are listed
  24. below.
  25.  
  26. Type-II membrane proteins where the CTL domain  is  located  at the C-terminal
  27. extremity of the proteins:
  28.  
  29.  - Asialoglycoprotein receptors (ASGPR)  (also  known as hepatic lectins) [4].
  30.    The ASGPR's  mediate the endocytosis of plasma glycoproteins  to  which the
  31.    terminal  sialic acid  residue  in  their carbohydrate  moieties  has  been
  32.    removed.
  33.  - Low affinity immunoglobulin epsilon  Fc receptor (lymphocyte IgE receptor),
  34.    which plays  an  essential  role in the regulation of IgE production and in
  35.    the differentiation of B cells.
  36.  - Kupffer cell receptor.  A  receptor  with  an  affinity  for  galactose and
  37.    fucose, that could be involved in endocytosis.
  38.  - A number of proteins  expressed on the  surface of  natural killer T-cells:
  39.    NKG2, NKR-P1, YE1/88 (Ly-49) and on B-cells: CD72, LyB-2. The CTL-domain in
  40.    these proteins  is   distantly related  to other CTL-domains; it is unclear
  41.    whether they are likely to bind carbohydrates.
  42.  
  43. Proteins that consist of an N-terminal collagenous domain  followed  by a CTL-
  44. domain [5], these proteins are sometimes called 'collectins':
  45.  
  46.  - Pulmonary surfactant-associated  protein  A (SP-A).   SP-A  is  a  calcium-
  47.    dependent protein that binds to surfactant phospholipids and contributes to
  48.    lower the surface tension at the air-liquid interface in the alveoli of the
  49.    mammalian lung.
  50.  - Pulmonary surfactant-associated  protein  D (SP-D).
  51.  - Conglutinin, a calcium-dependent lectin-like protein which binds to a yeast
  52.    cell wall extract and to immune complexes through  the complement component
  53.    (iC3b).
  54.  - Mannan-binding proteins (MBP)  (also  known as  mannose-binding  proteins).
  55.    MBP's  bind  mannose  and  N-acetyl-D-glucosamine  in  a  calcium-dependent
  56.    manner.
  57.  
  58. Selectins (or LEC-CAM) [6,7]. Selectins are cell adhesion molecules implicated
  59. in  the  interaction of  leukocytes  with  platelets  or vascular endothelium.
  60. Structurally, selectins consist of a long extracellular domain, followed by  a
  61. transmembrane  region  and  a  short  cytoplasmic  domain. The   extracellular
  62. domain is itself composed of a CTL-domain,  followed by an EGF-like domain and
  63. a variable number of SCR/Sushi repeats. Known selectins are:
  64.  
  65.  - Lymph node homing  receptor (also  known as L-selectin, leukocyte  adhesion
  66.    molecule-1, (LAM-1), leu-8, gp90-mel, or LECAM-1)
  67.  - Endothelial leukocyte adhesion molecule 1  (ELAM-1, E-selectin or LECAM-2).
  68.    The ligand recognized by ELAM-1 is sialyl-Lewis x.
  69.  - Granule membrane  protein 140 (GMP-140, P-selectin, PADGEM, CD62, or LECAM-
  70.    3). The ligand recognized by GMP-140 is Lewis x.
  71.  
  72. Large proteoglycans  that contain a  CTL-domain followed by one copy of a SCR/
  73. Sushi repeat, in their C-terminal section:
  74.  
  75.  - Aggrecan (cartilage-specific proteoglycan core protein).  This proteoglycan
  76.    is a major component of the  extracellular matrix of cartilagenous  tissues
  77.    where it has a role in the resistance to compression.
  78.  - Versican  (large  fibroblast  proteoglycan), a  large  chondroitin  sulfate
  79.    proteoglycan that may play a role in  intercellular signalling. In addition
  80.    to the CTL and  SCR/Sushi domains,  versican  also  contains  two  EGF-like
  81.    domains on the N-terminal side of the CTL domain.
  82.  
  83. A type-I membrane protein:
  84.  
  85.  - Mannan receptor from macrophages.  This protein mediates the endocytosis of
  86.    glycoproteins by macrophages in several  recognition  and uptake processes.
  87.    Its extracellular section consists of a fibronectin type II domain followed
  88.    by eight tandem repeats of the CTL domain.
  89.  
  90. Various other proteins that uniquely consist of a CTL domain:
  91.  
  92.  - Invertebrate soluble galactose-binding lectins.  A category to which belong
  93.    a humoral lectin from a  flesh fly; echinoidin, a lectin from  the coelomic
  94.    fluid of a sea urchin; BRA-2 and BRA-3, two lectins from the coelomic fluid
  95.    of a barnacle, a  lectin from the tunicate Polyandrocarpa misakiensis and a
  96.    newt oviduct lectin. The  physiological  importance of these lectins is not
  97.    yet known but they may play an important role in defense mechanisms.
  98.  - Pancreatic stone protein (PSP)  (also known  as  pancreatic  thread protein
  99.    (PTP), or reg), a protein that might act  as  an  inhibitor  of spontaneous
  100.    calcium carbonate precipitation.
  101.  - Pancreatitis associated protein (PAP), a  protein that might be involved in
  102.    the control of bacterial proliferation.
  103.  - Tetranectin, a plasma protein that binds  to  plasminogen  and  to isolated
  104.    kringle 4.
  105.  - Eosinophil granule major basic protein (MBP), a cytotoxic protein.
  106.  - A galactose specific lectin from a rattlesnake.
  107.  - Two subunits of a coagulation factor IX/factor X-binding protein (IX/X-bp),
  108.    a snake venom anticoagulant protein  which  binds with  factors IX and X in
  109.    the presence of calcium.
  110.  - Two subunits of  a  phospholipase A2 inhibitor from  the  plasma of a snake
  111.    (PLI-A and PLI-B).
  112.  - A lipopolysaccharide-binding  protein  (LPS-BP)  from  the  hemolymph  of a
  113.    cockroach [8].
  114.  - Sea raven antifreeze protein (AFP) [9].
  115.  
  116. As a signature pattern for this domain, we selected the C-terminal region with
  117. its three conserved cysteines.
  118.  
  119. -Consensus pattern: C-[LIVMFATG]-x(5,12)-[WL]-x-[DNSR]-x(2)-C-x(5,6)-
  120.                     [FYWLIVSTA]-[LIVSTA]-C
  121.                     [The three C's are involved in disulfide bonds]
  122. -Sequences known to belong to this class detected by the pattern: ALL,  except
  123.  the distantly related natural killer T-cell and B-cell proteins.
  124. -Other sequence(s) detected in SWISS-PROT: 7.
  125.  
  126. -Note: all CTL domains have five Trp residues before the second Cys,  with the
  127.  exception of tunicate lectin and cockroach LPS-BP which have Leu.
  128.  
  129. -Expert(s) to contact by email: Drickamer K.
  130.                                 drick@cuhhca.hhmi.columbia.edu
  131.  
  132. -Last update: June 1994 / Pattern and text revised.
  133.  
  134. [ 1] Drickamer K.
  135.      J. Biol. Chem. 263:9557-9560(1988).
  136. [ 2] Drickamer K.
  137.      Prog. Nucleic Acid Res. Mol. Biol. 45:207-232(1993).
  138. [ 3] Drickamer K.
  139.      Curr. Opin. Struct. Biol. 3:393-400(1993).
  140. [ 4] Spiess M.
  141.      Biochemistry 29:10009-10018(1990).
  142. [ 5] Weis W.I., Kahn R., Fourme R., Drickamer K., Hendrickson W.A.
  143.      Science 254:1608-1615(1991).
  144. [ 6] Siegelman M.
  145.      Curr. Biol. 1:125-128(1991).
  146. [ 7] Lasky L.A.
  147.      Science 238:964-969(1992).
  148. [ 8] Jomori T., Natori S.
  149.      J. Biol. Chem. 266:13318-13323(1991).
  150. [ 9] Ng N.F.L., Hew C.-L.
  151.      J. Biol. Chem. 267:16069-16075(1992).
  152.